首页> 外文OA文献 >'Liar, Liar Pants on Fire': A New Benchmark Dataset for Fake News Detection
【2h】

'Liar, Liar Pants on Fire': A New Benchmark Dataset for Fake News Detection

机译:“Liar,Liar pants on Fire”:假新闻的新基准数据集   发现

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Automatic fake news detection is a challenging problem in deceptiondetection, and it has tremendous real-world political and social impacts.However, statistical approaches to combating fake news has been dramaticallylimited by the lack of labeled benchmark datasets. In this paper, we presentliar: a new, publicly available dataset for fake news detection. We collected adecade-long, 12.8K manually labeled short statements in various contexts fromPolitiFact.com, which provides detailed analysis report and links to sourcedocuments for each case. This dataset can be used for fact-checking research aswell. Notably, this new dataset is an order of magnitude larger than previouslylargest public fake news datasets of similar type. Empirically, we investigateautomatic fake news detection based on surface-level linguistic patterns. Wehave designed a novel, hybrid convolutional neural network to integratemeta-data with text. We show that this hybrid approach can improve a text-onlydeep learning model.
机译:自动伪造新闻检测在欺骗检测中是一个具有挑战性的问题,它在现实世界中具有巨大的政治和社会影响。然而,由于缺乏标记的基准数据集,打击伪造新闻的统计方法受到了极大的限制。在本文中,我们介绍:一个新的,可公开获取的伪造新闻检测数据集。我们从PolitFact.com收集了各种情况下长达adecade长达12.8K的手动标记的简短语句,该语句提供了详细的分析报告以及每种情况的源文档链接。该数据集也可以用于事实检查研究。值得注意的是,这个新数据集比以前的同类最大的公共假新闻数据集大一个数量级。根据经验,我们研究基于表面层语言模式的自动伪造新闻检测。我们设计了一种新颖的混合卷积神经网络,以将元数据与文本集成在一起。我们证明了这种混合方法可以改善纯文本深度学习模型。

著录项

  • 作者

    Wang, William Yang;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号